[レポート]統合された金融情報コンテンツで投資プロセスを高度化 #MobilizeYourData #TheDataCloud
2020年11月25日にSnowflake社が主催するバーチャルイベント、Data Cloud Summit 2020 が開催されました。
当エントリでは、Data Cloud Summit2020 のセッションの中から、ファクトセット・パシフィック社三本木様による「統合された金融情報コンテンツで投資プロセスを高度化」についてレポートします。ファクトセット社では Snowflake Data Marketplace や open fact set を通じてデータを公開されています。Snowflake がもつデータシェアの機能をフル活用した先進的な事例紹介となっておりますのでぜひセッション動画と合わせてご覧ください。動画では、実際の画面を通じて具体的な分析をおこなうデモもご覧いただけます。
セッション概要
スピーカー
- 三本木宏氏(ファクトセット・パシフィック社)
内容
ファクトセットが提供するオルタナティブデータを含む様々な財務及び非財務情報を、Snowflake Data Cloudを使用して簡単にアクセスする方法をご紹介します。各種コンテンツは自社データとシームレスに統合が可能です。また標準SQLを使用して、構造化データと半構造化データへの安全な同時アクセスを活用する方法や、リリース予定の新しいコンテンツや機能もご紹介します。
セッションレポート
はじめに
- (三本木さまは)日本国内における、情報端末を介さないデータフィードビジネス、いわゆるオフプラットフォームビジネスを担当
- Snowflake とのパートナーシップによって可能となった Snowflake Data Cloud を利用した投資プロセスの影響について以下でご紹介
- 前半:スライドで簡単な概要を説明
- 後半:実際にデモを通して分析事例を紹介
イノベーションの歴史
-
- ファクトセット社
- 40年以上にわたってバイサイド(運用会社)、セルサイド(証券会社)などの金融機関向けにソリューションを提供
- 2000年前半頃までは、独自コンテンツではなく、様々な金融データを収集してユーザーが使いやすい状態にして提供するというのが大きな強み
- 現在は、オフプラットフォームビジネスにおいて、数十の独自データセットを含む100以上のデータセットを統合しクライアントに提供し、さらに金融機関のためにより多くのコンテンツを投稿することを推進し続けている
- ファクトセットが統合している全てのデータの一覧は以下を参照
- ファクトセットが強化しようとしてもう一つの分野としてクライアントワークフロー強化が挙げられる
- クライアントが構築できるモジューラ型の柔軟なアーキテクチャを提供しているが、今日はその中でも特にデータに焦点を当てる
- クライアントがアクセスしやすい方法でデータを提供することはワークフローを強化する上で非常に重要であり、Snowflakeとのパートナーシップではまさにその部分を可能にしている
- ファクトセット社
金融機関を取り巻く現在の環境
-
- 金融機関では、顧客の価値を高めるための最善のアプローチのバランスを常にとっているところが多い
- これは現在も頻繁に議論されているアクティブ対パッシブの議論に繋がる一方で、手数料の削減に対処し他の方法で彼ら自身の収益性を確保しようとしているということでもある
- 規制やレギュレーションの状況も絶えず変化しており、これらは金融機関の多くが人的時間的リソースを割いている中核的なものである
- この2つの議題というのはどちらも現在の状況を見ると密接に関連し合ってる
- いろんな企業で DX デジタルトランスフォーメーションの最中
- クラウドに移行しようというしてる最中に同時並行でオンプレのインフラを実行しつつ、コードを書き換えながらイノベーションを同時に行うというのは大変な作業である
- ファクトセットと Snowflake を組み合わせることで、この問題に一定程度対処できるんではないかと考えている
- 最後の課題というのは世の中に存在する膨大な量のデータ、例えば ESG を例にとると、スタートアップから Truvalue Labs 社を買収した弊社のような会社まで、様々なメソドロジーを持ち、それぞれの ID 体型を持つ企業がたくさんある
- そのため金融機関はどのプロバイダを利用するかを選択するだけではなく、その決定を行った後に、それらのプライマリーキーを自社の ID を適切に名寄せ紐付けして、分析に使える状態にするまでの作業に多くの時間と労力を費やす必要がある
- この部分に関しては、弊社がそれぞれのテーマにおける主要なプロバイダさんを統合するだけではなく、その ID 体型をも紐付けた上で金融機関にとって非常に使いやすい形でデータを提供している
投資プロセスにおけるデータ
-
- 左側の丸い図で表現しているフレームワークにより弊社は様々なコンテンツの ID 体型をつなぎ合わせた状態で提供することが可能
- それぞれのコンテンツが CUSIP、TICKER、SEDOL、ISIN、LEIなどの市場に存在している ID 体型をして使用しているか、あるいは独自の ID を使用してるかどうかにかかわらずこれら全てを一つの結合したモデルにマッピングすることができる
- これは現在の投資家の対象母集団だけではなく、ポートフォリオ構築プロセスの重要な様子であるデータに対しても、また過去にわたっても同様にマッピングすることを可能にしている
データマネジメントソリューション:発行体と発行証券のリンク
- このスライドではファクトセットの ID マッピングの部分のデータを含むデータマネジメントソリューションの中身を見ていく
- 上半分が薄い青色の部分が発行体レベル、紺色が発行証券レベルのデータ
- 発行体レベル
- ファクトセットでは独自かつ普遍の発行体 ID を管理している
- その ID にマッピングされる形で LEI や SWIFT コード などの外部 ID がある
- 発行体レベルではビジネス概要、業種、住所、設立年月日などのレファレンスデータを提供しています。
- リスクの観点では、所在国や設立国だけではなくて Country Of Risk や、ファクトセットの独自のデータである Geographic Revenue Exposure のデータを利用した Geo Country Of Risk なども提供している
- 発行体レベルでリンクされているファクトセットのコンテンツとしは、サプライチェーンや企業の親子関係イベント記録や資本構造などが含まれる
- 発行体レベルのデータにぶら下がる形で、証券レベルのデータも提供しており、発行体IDと同様、証券レベルの独自かつ普遍の ID に対して CUSIP、ISIN、SEDOL、FIGIなどの外部 ID がマッピングされている
- アセットクラス取引所規制対応で使われるようなCICコードなど様々なリファレンスデータが取得可能
- 証券レベル
- 証券レベルでリンクされているファクトセットのコンテンツには株主情報や業績予想、実績、財務や株価、価格情報などが含まれる
### コンテンツの配信方法
- 前のスライドまででご紹介したコンテンツを配信する方法について簡単にご紹介
- これまで
- これらのコンテンツを更新するローダーツールをクライアントがセットアップして利用するという方法をとっていた
- これは任意のリレーショナルデータベースに対して設定する、プロセス自体はクライアントによって管理されるセルフサービス型となっていた
- クライアントはそこからキャパシティプランなど一般的な DB 機能を実行する必要があった
- これに対して Snowflake の活用によって
- この管理のほとんどが実際にはファクトセットによって行われるようになった
- ファクトセットがコンテンツのロードと更新を管理し snowflake はクライアントが選択したクラウドプロバイダーの上に拡張性に優れたテクノロジーを提供する
- これは金融データにアクセスするにあたって強力かつシンプルなアプローチになっており、これにより ETL/ELT にかけるリソースを大幅に軽減することが可能
- クライアントは本来時間を割くべき分析業務に集中することができるようになる
### 利用可能なコンテンツ
- Snowflake とのパートナーシップを通じて何ができるのかをご紹介
- 現在70以上のデータベースが利用可能
- このリストはファクトセットがパートナープロバイダさんを統合するにつれて現在も増え続けている。
- これらのデータベースのうち30以上はファクトセットから直接提供
- 40以上はパートナープロバイダから提供
- これらのコンテンツは全て先にご紹介した発光体と ID 体型でマッピングされている
- Snowflake 上で1時間ごとに更新されている
- データは Snowflake が現在サポートしているどのクラウドプロバイダーやリージョンからもアクセス可能
- 現在サポートしていない理由の場合でも、数営業日でレプリケーションを有効にすることは可能ですぐに稼働状態にできる
- 右のスクリーンショットにあるようにファクトセットとパートナープロバイダーの一覧が Snowflake Data Market Place に表示される
- Open Fact set Market Place に加えて、ここでもどのようなコンテンツが利用可能かをリサーチするには非常に有効
- コンテンツの概要、サンプルコード、仕様書などの各種ドキュメントに加えて Open Fact Set Market Place へのリンクも用意している
Snowflake Data Market Place
- これらの素晴らしいコンテンツを、自社データと現在 Market Place にデータをロードしている他のプロバイダとで簡単に組み合わせることが可能
- その結果、選択したクラウドプロバイダ上で全てのコンテンツを素早く検索、発見しワークフローにシームレスに統合することが可能
- もう一つ重要な点は、ファクトセットのデータに非常に素早くアクセスできること
- Marketplace から Snowflake シェアを起動するにかかる時間はおそらく10分もかからない
- このプロセスをもう少し掘り下げていく
Real-Time Collaboration
- ファクトセットは、Snowflake 上で多数のデータセットを公開している
- これらのデータは本番コピーを保持
- Snowflake がサポートするすべてのクラウドプロバイダーとリージョンで利用できるようにしている
- Snowflake Data Marketplace を通じてこれらのデータセットのいずれかにアクセスをすると、基本的にはそのデータセットの本番コピーへのポインターにアクセスすることになります。
- そのデータのコピー、ETL、コンテンツに関する追加のストレージ領域はなく、Snowflake のアカウントへログインしクエリを開始するだけとなる
- このシェアの設定にかかる時間はおよそ10分ほどで、これ以上に簡単かつ早くシェアがおこなわれるようになることおそらく非常に難しいのではないかと考える
- 現在はこれらのコンテンツを1時間ごとに更新しており、毎月2、3の新しいデータセットを追加している
- Snowflake で実行してる SQL クエリは、本番コピーに対して実行されているため、これらの差分更新部分にアクセスするためには何もする必要はない
- ここでも、以前のように ETL プロセスを管理する必要もなく、その代わりに本来時間を割くべき業務に集中できるようになる
Snowflake Data Marketplace における FactSet コンテンツ
- Snowflake とのパートナーシップが与える影響についてここで一度まとめる
- 1点目
- 世界中で標準である SQL 言語活用することができるます。これによって新しい言語を学ぶ必要がない
- 2点目
- これは snowflake 本来の機能になりますが、一つの環境で構造化データと半構造化データの両方にアクセスすることができる
- 3点目
- ファクトセットのコンテンツの ETL プロセスを管理する必要がない
- もちろんスノーフレーク内に保存された独自コンテンツについては自社で管理することになるが、サードパーティーデータの統合を気にする必要がないため Snowflake インスタンスの透明性やガバナンスといったら残りのデータウェアハウス機能に集中することができる
- 4点目
- ファクトセットはすでに過去のデータにリンクしているのでデータのマッピングやコンテンツのソースについて心配する必要がない
- 各コンテンツセットにそれぞれ必要なドキュメントが用意されておりデータを本番環境に素早く組み込むのに役立つ
- 最後に
- 柔軟性と拡張性があることと同時に、データハンドリングにリソースを割く必要がなくなります。
- これらすべては TCO の削減に寄与し、それによってコアコンピタンスに対して集中、注力することが可能になる
ベンチマークデータフィードサービス
- 弊社における二つの新製品リリースについて簡単に触れる
- 一つ目はファクトセットのベンチマークデータフィードサービス
ベンチマークデータフィード
- 複数の資産クラスでまたがる100以上のベンチマークベンダーの35万以上のベンチマークに関する、ベンダーソースの正式なリターン及び構成銘柄データの情報を提供
- 統合されたフォーマットでベンチマークデータを提供し、ブレンドやヘッジ、日ずらしやカスタマイズおよびクライアント定義のベンチマークを提供することが可能
- 特に歳計の分野において、ベンダーが提供する項目を保管する分析エンジンを活用したデータ項目を提供なども行なっていおり、それにより様々なワークフローのニーズに対応し、配信方式も現在の FTP、SFTP の配信や、オープン API エンドポイントの開発を継続することで FTP、API いづれの方式での提供も可能
- 弊社の通常のデータフィードサービスと同様に24時間365日対応のグローバルサポートを提供
ベンチマークデータの統合
- 広範なベンチマークにおいて、指数値および構成銘柄レベルのデータ項目を複数のベンチマークデータベンダーにまたがって統合して提供可能
- それぞれのベンチマークベンダーによって行われているプロセスに加えて、ファクトセット独自のプロセスもかぶせることによって信頼性を確保
- 他にも弊社のポートフォリオアナリティクス分野における数十年の経験により、ベンダーが提供するデータを、弊社が提供するコンテンツやブレンド、ヘッジ、派生分析などの機能で補完することも可能
ベンチマークデータフィード概要
- 実際のベンチマークデータフィードの中身についてこちらのスライドで簡単にご紹介
- 基本的には一貫した行動体系を備えた統一形式のベンチマークデータを4つのファイル構造で提供
- 履歴やリバランス、リビジョン管理することでクライアント側でそれを管理、保守、運用する必要がなくなる
- また、4ファイル構造により効率的な配信と保存のための冗長性が軽減される
- スライドの右側
- まず構成銘柄数で価格などトップレベルのインデックスデータはインデックスファイルに格納される
- 次にウェイトや浮動株比率などのインデックス固有の銘柄データはコンスティチューントファイルに格納される
- そしてベンダーIDやセクターなどのベンダー固有のデータはファミリーファイルに格納される
- 最後にファクトセット ID のようなベンダ固有でないデータといったものはセキュリティファイルに格納されるような形になる
ティックデータ
-
- ご紹介する二つ目のプロダクトはリアルタイム価格に関するもの
取引所データフィードソリューション概要
- 弊社は独自のテクノロジーにより、200を超えるグローバルの取引所と150以上の標準化されたデータ項目を提供している
- アセットクラスとしては、株式、先物、オプション、ワラント、債券、投信、ETF、インデックス、コモディティ、為替レートなどのデータ
- また、弊社は冗長性のあるデータセンターを活用して標準化された取引所データへのシンプルなプログラマティックアクセスを実現している
- 柔軟性としましては REST API やデータフィードを活用して、独自およびサードパーティ製アプリケーションへのデータ統合を簡単に行うことができるようになっている
Snowflake 経由のティック履歴
- クライアントからいただくリクエストの一つとして、このリアルタイム型の価格データの履歴すべてにアクセスしたいという話がある
- このデータベースは非常に大きく、現在は約300 TB ほどの容量があり、当然ながら現在も増え続けている
- Snowflake はこのような大規模データを利用するために理想的な環境が整っている
- 200以上の取引所から2012年まで遡って様々なデータを利用することができる。
- 研究戦略を実行している場合でも、TCAを検討している場合でも Snowflake の力でこれらのコンテンツのすべてにアクセスすることができる
分析事例をご紹介
ここからは、実際の画面を通じて Snowflake のデータシェア、提供しているコンテンツ等を用いた分析事例のご紹介がありました。詳しくはセッション動画をご覧ください。
まとめ
Snowflake Data Marketplace を活用して外部にデータを公開する先進的な事例セッションでした。冒頭でもご紹介しましたが公開されているデータは Snowflake Data Marketplace や open fact set でご覧いただけます。繰り返しですが、セッション動画の公開もございますのでご興味のある方はぜひご覧ください。
それでは失礼いたします。